在这项工作中,借用编码器数据的学习框架的功能可以预测在漫长的未来视野中的软失败演化。这使得在发生昂贵的硬失败之前,可以通过低质量(QOT)利润来触发及时的维修操作,最终降低了维修操作的频率和相关的运营费用。具体而言,结果表明,所提出的方案能够在预期的艰苦失败前几天触发修复动作,与使用基于规则的固定QOT边缘的软失败检测方案相反,这可能会导致过早维修措施(即,在发生艰苦的事件发生之前的几个月)或修复为时已晚采取的措施(即发生艰苦失败之后)。在弹性光学网络中建立的LightPath评估并比较了两个框架,可以通过分析在相干接收器中监视的位误差信息来对软失败的演变进行建模。
translated by 谷歌翻译
无人驾驶汽车(UAV)的使用提供了各种应用程序的许多优势。但是,安全保证是广泛使用的关键障碍,尤其是考虑到无人机所经历的不可预测的操作和环境因素,这些因素很难仅在设计时间内捕获。本文提出了一种称为SAFEDRONES的新可靠性建模方法,以通过实现无人机的运行时可靠性和风险评估来帮助解决此问题。它是可执行数字可靠身份(EDDI)概念的原型实例化,该概念旨在为多机器人系统的实时,数据驱动的可靠性保证创建基于模型的解决方案。通过提供实时可靠性估算,SAFEDRONES允许无人机以自适应方式相应地更新其任务。
translated by 谷歌翻译
交叉路口交叉代表了运输系统的瓶颈和连接的自动驾驶汽车(CAVS)可能是解决问题的开创性解决方案。这项工作提出了一个新颖的框架,即避免到期,其中相交经理(IM)控制着骑士接近交叉点,以最大程度地提高交叉路口的能力,同时最大程度地减少骑士的气体消耗。与文献中的大多数作品相反,骑士的位置不确定性被解释了,定期交流和重新优化允许为骑士创建安全的轨迹。为了提高高流量交叉点的可伸缩性,还开发了(避免事件)事件触发方法,以最小化计算和通信复杂性。避免事件将要求的重新挑选的数量减少92.2%,同时保留避免期间引入的大多数好处。
translated by 谷歌翻译
随着未经驾驶汽车(UAV)未经授权操作的数量正在上升,多功能反无人机系统的实施变得必要。在这项工作中,我们开发了一种基于无人机的反无人机系统,该系统采用算法来检测和跟踪无人机无人机,并与无线截距功能结合使用,共同堵塞了流氓无人机,同时为追捕者无人机实现自我定位。在拟议的系统中,软件定义的Radio(SDR)用于在障碍物传输和频谱清除功能之间进行切换,以分别实现所需的GPS破坏和自定位。广泛的现场实验证明了在各种参数设置下在现实世界环境中提出的解决方案的有效性。
translated by 谷歌翻译
现有的唱歌语音合成模型(SVS)通常在唱歌数据上进行训练,并取决于容易出错的时间对齐和持续时间功能或明确的音乐得分信息。在本文中,我们提出了Karaoker,Karaoker是一种基于多言式Tacotron的模型,该模型以语音特征为条件,该功能专门针对口语数据进行训练,而无需时间对齐。卡拉克(Karaoker)在从看不见的歌手/扬声器的源波形中提取的多维模板之后,综合了歌声和传输风格。该模型在连续数据上以单个深卷积编码为共同条件,包括音高,强度,和谐,实扣,cepstral峰值突出和八度。我们通过功能重建,分类和说话者身份识别任务扩展了文本到语音训练目标,这些任务将模型指导到准确的结果。除多任务外,我们还采用了Wasserstein GAN训练方案以及声学模型的输出的新损失,以进一步完善模型的质量。
translated by 谷歌翻译
本文介绍了一种在自回归关注文本到语音系统中控制音素级别的韵律的方法。除了通常完成的常见框架中,我们将从培训集中的语音数据中直接提取音素级F0和持续时间特征,而不是学习潜在韵律特征。每个韵律特征是使用无监督聚类离散化,以便为每个话语产生一系列韵律标签。该序列与音素序列并行使用,以便通过利用韵律编码器和相应的注意模块来调节解码器。实验结果表明,该方法保留了高质量的生成语音,同时允许对F0和持续时间进行音素级控制。通过用音符替换F0集群质心,该模型还可以在扬声器范围内提供对音符和八度音的控制。
translated by 谷歌翻译
本文介绍了对F0的音素级韵律控制的方法和多销箱文本到语音设置的持续时间,基于韵律聚类。使用自回归关注的模型,并将多个箱子架构模块并联,与韵律编码器并联。提出了对基本单扬声器方法的几种改进,从而增加了韵律控制范围和覆盖范围。更具体地说,我们采用数据增强,F0​​标准化,持续时间的平衡集群,以及扬声器无关的韵律聚类。这些修改使培训集中包含的所有发言者能够进行细粒度的音素级韵律控制,同时保持扬声器标识。该模型也可以微调到具有限制数据量的看不见的扬声器,并显示其维持其韵律控制能力,验证说话者无关的韵律聚类是有效的。实验结果验证了该模型维持了高输出语音质量,并且该方法允许在每个扬声器范围内有效的韵律控制,尽管多种式箱子设置介绍的变化。
translated by 谷歌翻译
在本文中,介绍了文本到读取/唱歌系统,可以适应任何扬声器的声音。它利用基于TacoTron的多级箱子声学模型在只读语音数据训练,并且在音素级别提供韵律控制。还研究了基于传统DSP算法的数据集增强和额外的韵律操纵。神经TTS模型对看不见的扬声器的有限录音进行了微调,允许与目标的扬声器语音进行敲击/歌唱合成。描述了系统的详细管道,其包括从Capella歌曲的目标音调和持续时间值提取,并将其转换为在合成之前的目标扬声器的有效音符范围内。还研究了通过WSOLA输出的输出的韵律操纵的另外的阶段,以便更好地匹配目标持续时间值。合成的话语可以与乐器伴奏轨道混合以产生完整的歌曲。通过主观聆听测试评估所提出的系统,以及与可用的备用系统相比,该系统还旨在从只读训练数据产生合成歌唱语音。结果表明,该拟议的方法可以产生高质量的敲击/歌声,具有增加的自然。
translated by 谷歌翻译
最近最近提出了使用音韵特征而不是音素作为输入到序列TTS的输入,用于零拍摄的多语言语音合成。这种方法对于代码切换是有用的,因为它促进了嵌入在本机的流中的外语的无缝发出。在我们的工作中,我们培训了一种语言 - 无人物多相箱模型,在不同语言中常见的一组音牙衍生特征上,其目标是实现交叉语言扬声器适应。我们首先尝试语言语音相似性对几种源语言组合的交叉语言的影响。随后,我们可以在看见或一个看不见的语言中使用非常有限的新扬声器语音数据进行微调,并实现了相同质量的合成语音,同时保留了目标扬声器的身份。随着目标扬声器数据的32和8个话语,我们获得高扬声器相似性分数和与相应文献相当的自然。在仅为2种可用的适应话语的极端情况下,我们发现我们的模型表现为几滴学习者,因为在所见和看不见的语言方案中的性能相似。
translated by 谷歌翻译
本文介绍了一个端到端的文本到语音系统,CPU延迟低,适用于实时应用。该系统由基于自回归关注的序列到序列声学模型和用于波形生成的LPCNet声码器组成。提出了一种采用塔克罗伦1和2型号的模块的声学模型架构,而通过使用最近提出的基于位置的注意机制来确保稳定性,适用于任意句子长度。在推断期间,解码器是展开的,并且以流式方式执行声学特征生成,允许与句子长度无关的几乎恒定的延迟。实验结果表明,声学模型可以产生比计算机CPU上的实时大约31倍的功能序列,移动CPU上的6.5倍,使其能够满足两个设备上实时应用所需的条件。全端到端系统可以通过听证测试来验证几乎是自然的质量语音。
translated by 谷歌翻译